LDA相关论文
隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)是文本挖掘常用的主题模型,该模型用词频向量来表示文档,用数字表达代替文本内......
构建切实有效的产业创新生态系统,对国家创新能力建设具有重要的实践意义。文章以“产业创新生态系统”作为关键词在知网上检索,以20......
随着互联网信息技术的快速发展,越来越多的数字阅读产品在儿童阅读读物市场不断涌现,智能手机、平板电脑等移动设备是儿童开展阅读......
通过刻画城市旅游吸引物地理画像,可为城市旅游吸引物建设和游客出行提供参考,但现有相关研究较少考虑到旅游吸引物的空间位置和配套......
21世纪后,随着我国人口死亡率、生育率的不断降低,以及人均预期寿命的不断延长,中国的老龄化进程开始加快。老年人口慢性病患病率......
【目的/意义】研究旨在揭示社会化问答平台用户的养生健康信息需求分布特征,并深入探究需求产生的动机及演化趋势。【方法/过程】本......
【目的/意义】识别信息隐私研究领域的热点主题,梳理主题演化路径。【方法/过程】针对主题识别语义杂乱等问题,提出时序关联与结构表......
目的 梳理总结中医药人工智能领域近40年的研究情况,分析该领域研究主题演化过程,发现热点主题和研究前沿。方法 本研究检索了CNKI和......
现如今,网络技术的发展促使人们的购物方式由线下转为线上,而自从2020年新冠疫情爆发以来,线上购买变得更加普及。网购成为一种趋......
如何设计能突出区域特色、带动边缘地区经济、整合周边资源的旅游路线是许多城市迫切需要解决的问题。以普洱市旅游景点作为研究对......
针对传统评论方式依赖整体感知且相对滞后的问题,以弹幕这一新兴短信息表达方式为研究对象,采用文本挖掘与情感分析的方式研究弹幕与......
[目的/意义]本研究通过对国外代表性数字人文众包项目中隐私政策框架及内容的梳理,为我国数字人文众包项目中个人信息保护及隐私政......
【目的/意义】基于文献数据的领域知识图谱构建有助于探测某学科领域的主要研究内容及其发展方向,是进行技术创新的基础情报工作,......
自然语言处理(NLP)是计算机科学中一项充满挑战性的研究,广泛应用于文本挖掘领域。通过对人类语言处理过程,它能使计算机理解文本文......
近些年来,随着互联网科技的快速发展,推进法院信息化的建设工作也被纳入战略部署。伴随着数据以指数级别的速度累积增长,以及大数......
随着互联网和大数据技术的飞速发展,我们以已步入信息时代,在现如今信息化的时代背景下,极大地改变了人们获取信息、发表观点和看......
随着网络越来越发达,以及信息技术越来越完善,人们实现了“在家不出门,便知天下事”的信息自由。接踵而来的不再是信息稀缺的问题,......
随着我国社会经济的疾速发展,私家小轿车购买量持续增长。道路交通流量随之上升伴随而来的是日趋严重的交通拥堵、交通事故与社会......
随着首个在线旅游数据生态共建倡议书的发布,在线评论数据更加真实、准确地表达顾客的客观感受,成为商家和消费者情报的重要来源。......
为揭示高等教育国际化研究成果的主题内容及其演化规律,将CSSCI数据库中与高等教育国际化相关的文献摘要和文本作为数据源,采用时......
课程质量是影响高职院校学生在线学习质量的重要因素.已有研究多聚焦于具体课程建设的实践研究或调查分析,存在研究系统性、针对性......
近年来网络社交平台兴起,大众倾向于在网上发表日常生活的感受,通过对这些文本的分析可以挖掘出人们的情感信息.文章基于新冠疫情......
以“蚂蚁金服”事件网络评论为样本,借鉴生命周期理论划分评论发展阶段,运用词云图与语义网络进行文本特征可视化和关联分析,并基......
随着移动互联网的迅猛发展与5G技术的商用,基于位置的应用服务(Location Based Service,LBS)越来越普及,地图导航、社区电商和移动社......
在中国,每年因误食含有农药残留的水果和蔬菜而中毒的人数超过10万人,死亡率约为20%。当前的农药残留检测设备不能同时满足对高精......
人机交互技术越来越成熟的今天,城市轨道交通乘客已经实现出行时使用手机扫码或刷卡即可进出站,部分地铁公司已经开始开发具有提醒......
建设高质量教育体系是我国新时期教育发展的政策导向和重点要求.本研究从高质量教育体系建设的政策文本分析入手,从立德树人的根本......
[目的]基于核心专利的技术融合测度和LDA主题模型,对突破性创新技术主题进行识别.[方法]基于Innography平台界定核心专利,应用Rao-......
[目的]从社交媒体视角出发,提出一种全新的知识发现思路和方法,预测医药领域主题关联机会,实现新兴主题早发现、早研究.[方法]以社......
随着世界和我国的电子科技和互联网技术的快速进步和发展,以及现代智能手持通信设备的普及,新浪微博因其低门槛和自由的信息传播特......
随着智能设备的不断出现,图像数量急速增加,但是很多图像因为没有被标注所以未被充分利用.为了能够使该问题得到较好解决,提出了基......
随着智能终端的发展和普及,人们的衣食住行逐渐从线下转为线上,越来越多的人在外出住宿时会选择从网上预订酒店,因此选择一款方便......
[目的]揭示文本作者对项目的关注点以及态度变化,深入分析众筹项目在线评论主题动态演化规律.[方法]采用来自Kickstarter的6537个......
提出一种深度特征与传统图像特征融合的图像分类算法.通过OpenCV库提取图像的特征点;使用深度学习预训练模型VGG19获取图像的深度......
为方便快捷地鉴别不同产地肉苁蓉,探索一种基于电子鼻技术结合模式识别方法的肉苁蓉快速鉴别方法.采用PEN3电子鼻分析电子鼻传感器......
针对基于传统LDA主题模型的标签生成算法对用户兴趣主题描述不完整的问题,提出一种基于主题嵌入表示的微博用户标签生成算法TopicE......
2020年初爆发的新冠肺炎疫情是近年来最大公共卫生事件,挖掘期间关于医疗物资社会舆情的性质和演变趋势,有助于我们了解事件演化和......
[目的/意义]跨学科是当今科学发展的显著特征,以跨学科研究特征为主的跨学科性研究探索,不仅为厘清跨学科研究主题提供重要线索,而......
Collaborative filtering (CF) is one of the most widely used Algorithm in recommender systems,which help users obtain the......
我国作为世界第二人口大国,老年人口数量庞大。民政部最新数据显示,“十四五”期间,我国老年人口将突破3亿(1),高龄化、空巢化、少子......
The flow within and above plant canopies in estuarine wetlands is normally turbulent in the inter-stem space.Turbulent k......
Ultrasonographic findings in cows with left displacement of abomasum, before and after reposition su
Forty dairy cows with left displacement of abomasum were ultrasonographically examined to determine the position and the......
软件文档及其程序代码之间的关联性或可追踪性分析是软件分析、理解的重要基础。本文探讨了软件的中文文档和程序代码中蕴含的主题......
主题模型(latent topic model)用于提取隐含在文档集中的主题,其中每个主题是语义相关的一些词的多项式分布。主题模型不但可以发现......
会议
传统的推荐算法随着用户和项目的数量增多,新用户在单一项目上的行为减少,导致推荐质量较低,鉴于此,提出一种融合文档主题算法(LDA)......
多文档自动文摘能够帮助人们自动、快速地获取信息,本文实现了一个基于主题模型的中文多文档自动文摘系统,其中主题模型采用浅层狄利......